智能论文笔记

Training for the Future: A Simple Gradient Interpolation Loss to Generalize Along Time

Anshul Nasery , Soumyadeep Thakur , Vihari Piratla , Abir De , Sunita Sarawagi

分类：机器学习 | (统计)机器学习

2021-08-15

在几个真实的世界应用中，部署机器学习模型以使数据对分布逐渐变化的数据进行预测，导致火车和测试分布之间的漂移。这些模型通常会定期在新数据上重新培训，因此他们需要概括到未来的数据。在这种情况下，有很多关于提高时间概括的事先工作，例如，过去数据的连续运输，内核平滑时间敏感参数，最近，越来越多的时间不变的功能。但是，这些方法共享了几个限制，例如可扩展性差，培训不稳定，以及未来未标记数据的依赖性。响应上述限制，我们提出了一种简单的方法，该方法以时间敏感的参数开头，但使用梯度插值（GI）丢失来规则地规则化其时间复杂度。 GI允许决策边界沿着时间改变，并且仍然可以通过允许特定于时间的改变来防止对有限训练时间快照的过度接种。我们将我们的方法与多个实际数据集的现有基线进行比较，这表明GI一方面优于更加复杂的生成和对抗方法，另一方面更简单地梯度正则化方法。

translated by 谷歌翻译